心理統計法 演習問題
https://gyazo.com/4f7dfd91756d579cff6ea820ee6ff329
1) 定められた操作に基づいて観測対象に数値を割り当てること
2) 階級に分けて観察された度数・確率・累積度数・累積確率をまとめた表
3) 縦軸に度数、横軸に階級あるいは階級値を配した統計グラフ
4) データを独立変数と見たときの関数
5) データの性質を縮約するための統計量
6) 平均値・中央値・最頻値のように分布の位置を記述する要約統計量
7) 測定値から平均を引いて2乗した値の平均
8) データの中の少数の甚だしい値の測定値
9) その測定値の下方に全データのα%があるような値
10) 最大度数を有する階級値
11) 平均を引いて標準偏差で割る一次変換
12) 理論分布の特徴を定めている数的指標
13) 特定の確率で測定値が観察される区間
14) 特定な区間で均等に測定値が観察される理論分布
1) 複数の測定値(や母数)の同時的観察に関する密度関数
2) 一方の測定値(や母数)が与えられた下での他方の分布
3) データで条件づけられた母数の分布を与える定理
4) 母数を変数、データを定数とした確率密度関数の値
5) データの関数によって母数を推定する方法
6) 尤度が最大になるように母数を推定する方法
7) データを見る前の母数に関する主観的な信念の確率分布
8) 分析結果を分析者(とその仲間たち)が享受する分析
9) 分析結果の知見を社会に還元するための分析
10) 事後分布にできるだけ影響しないような事前分布
11) 母数を含まないベイズの定理の分母
12) データが与えられたあとの母数の条件つき分布
放送授業
ベイズの定理は1740年代に発見された
フィッシャーによって1925年公刊された『研究者のための統計的方法』は超ベストセラー&ロングセラーだった
ベイズ的アプローチには、有意性検定の3倍の長さの歴史がある
MCMC法によって事後分布が評価できるようになり、ベイズ的アプローチが再評価された
1) 事後分布に従う母数をサンプリングする数値計算法
2) 力学的エネルギーの原理を応用したMCMC法の1つの手法
3) 初期に発生させたMCMCの乱数のうち捨てて利用しない期間
4) 経時に沿って乱数の値を折れ線で表現したグラフ
5) 事後分布から正しく乱数が発生しているか否かを判定する指標
6) 母数の事後分布を点で代表させる方法
10) ある確率に相当する事後分布の端を除いて残った中央部の区間
11) 将来観測されるであろうデータの分布
12) 研究上の問いと同義なカタカナ表記
1) MCMC法による母数の標本の関数
2) 連続的な値をとる測定特性のうち、絶対0点のあるもの
3) 連続的な値をとる測定特性のうち、絶対0点のないもの
4) 標準偏差を平均で割った散布度の指標
5) 実質科学的知見によって効果的な統計分析を行うために定めた点
6) 基準点と平均との差を標準偏差で割った指標
7) 確率の確率
放送授業
データの要約的記述には標本分散を利用し、母集団の推定には不偏分散を利用する、と習うことがある
これは明確な誤り
データ生成分布として正規分布を想定した場合には、分母が$ nの標本分散が母分散の最尤推定量になる だから標本分散も母分散を推定するための統計量として立派に利用できる
そもそも分散とは
数値要約の一種で、散布度に関する要約統計量
偏差の2乗の平均
$ n個の散らばりの平均
$ nを分母に置いたほうが自然
不偏性とは、分散に限らず、一般に推定量の平均的な値が母数に一致する性質のことである 真の値は誰も知らないけれど1点に固定した母分散に不偏分散の平均が一致する
ベイズ的アプローチでは、母数が確率的に分布するので、通常の意味での普遍性という概念はなくなる
$ n個の散らばりの平均である標本分散の方がわかりやすいので、標本分散を使う
1) 独立した2群とは、互いにどのように測定された群か
互いに影響し合わずに測定されている
2) 実験群に対する働きかけ
3) 処理をしない群
4) 喫煙者と非喫煙者を比較するとき、処理に相当する喫煙は
5) 治療群と非治療群を比較するとき、処理に相当する治療は
6) 男性群と女性群を比較するとき、処理に相当する性別は
7) 箱とその両側にでたひげで、データの分布を表現する統計グラフ
8) 75%点と25%点との差
9) 箱ひげ図の箱の端から四分位範囲のc倍以上の点
放送授業
帰無仮説$ H_0: $ \mu_1 = \mu_2が真であると暫定的に仮定する 聴音状態と安静状態では『知覚時間』の母平均は等しい
$ t値 = \frac{\bar x_1 - \bar x_2}{2群に共通の標準偏差} \times \sqrt{\frac{n_1 \times n_2}{n_1 + n_2}}
$ t値 = 2.39
平均値の差そのものが検定統計量になるわけではない
なぜこの式はt分布に従うのか
普通は教えない。暗
生成量なら定義式に従って計算するだけで、推測統計的考察が可能
p値とは帰無仮説が真であるときにデータから計算したt値より甚だしいt値が観察される確率
p値は帰無仮説が真であるときにt値が$ |2.39|より大きくなる確率$ p = 0.022
2.2%
参照確率と比較する
$ p値 < 0.05ならば帰無仮説を棄却し、母平均は有意差ありと判定する
$ p値 < 0.05なので「知覚時間」の平均値に差があると判定する
p値の本来の意味を誤解してしまいがち
まとめ
帰無仮説が真であるときに、分布の形状が数学的に解明されており、有意性検定のために利用する統計量を検定統計量という p値とは、帰無仮説が真であるときに、データから計算した検定統計量より甚だしい値が観察される確率である 有意水準とは、起きにくさの程度を予め定めた参照確率であり、$ 0.05が用いられることが多い p値は、帰無仮説が正しい確率と勘違いされることが多い
1) 平均値差は標準偏差の何倍かという指標
2) 第1群の平均値$ \mu_1は、第2群では何%点に相当するかという指標
3) 第1群の測定値が、第2群の測定値を上回る確率
4) 平均$ 0、標準偏差$ 1の正規分布
5) 第1群と第2群の測定値の差が基準点$ cより大きくなる確率
放送授業
帰無仮説は採択しても棄却しても誤りを犯す可能性がある
帰無仮説が真であるのに帰無仮説を棄却してしまう誤り
帰無仮説が偽なのに帰無仮説を採択してしまう誤り
$ \alphaと$ \betaは拮抗する性質があって、両方を同時に小さくすることは難しい
帰無仮説が偽であるときに、正しく帰無仮説を棄却する確率
table: 帰無仮説の2つの誤り
本当の状態 正しい判断 誤った判断
帰無仮説が真 帰無仮説を採択 1 - α 帰無仮説を棄却 α(第1種の誤り) 1) 1つの観測対象から2回測定したデータ
2) 縦軸と横軸に変数の目盛りを配し、観測対象を2次元平面上に付置した統計グラフ
3) 左下から右上がりにデータが打点される2変数の関係
4) 左上から右下がりにデータが打点される2変数の関係
5) 散布図に丸いボールのような形状が観測される2変数の関係
6) 各測定値から平均を引いた値のデータ
7) 平均偏差データの積の平均値
8) 平均偏差データを標準偏差で割った値のデータ
9) 標準化データの積の平均値
放送授業
5%水準で有意な結果が得られたからといって、帰無仮説が真である確率が5%以下であると解釈してはダメである
帰無仮説はデータを取る前から偽であることが明白である
帰無仮説の採択とは、帰無仮説を正しいものとして採用することではない
有意にならないからといって、差がないとは積極的にいえない
ダイエット法Aの効果を調べるために「対応ある2群の実験」を企画した。ダイエットプログラムに参加する「前の体重」と、参加した「後の体重」を測定し、次式で「減量」という変数をつくった。
$ 「減量」 = 「前の体重」 - 「後の体重」
以下の説明に相当する専門用語を答えなさい。
1) 「減量」の標準偏差
差得点の標準偏差
2) 前後の体重の平均値差は「減量」の標準偏差の何倍かという指標
差得点の効果量
3) 「減量」が$ 0kgより大きい確率
差得点の優越率
4) 「減量」が$ ckgより大きい確率
差得点の閾上率
放送授業
$ nが大きくなるとp値は平均的にいくらでも$ 0に近づく ビッグデータに対しては有意性検定は無力であり、「高度に有意」という無情報な判定を繰り返す $ nが大きくなることは分析可能な情報が増えることを意味し、望ましい状態である
「母平均の差は$ cより大きい」という研究仮説が正しい確率は、$ nの増加にともなって$ 0か$ 1に近づいていく
1) 研究目的に応じて、どのような実験を行えばよいかを研究する分野
2) 測定値の変動に影響する原因となるかもしれない質的な変数
3) 要因のとるさまざまな状態
4) 水準内の標準偏差
5) 各水準のデータ数が同じでないデータ
6) 水準の平均値と全平均との差
7) 測定値の分散に占める、要因の分散の比率
8) 同時に成り立つ複数の命題の集まり
放送授業
分散分析では、アンバランスか否かで計算方法が変わる
計算の方法は理解ではなく、しばしば暗記させられる
ベイズ的アプローチでは、アンバランスか否かで計算手順は変わらない
アンバランスという状態は、実験計画にとって決して望ましい状態ではなく、できるだけ避けるべきである
分散分析の要因の効果がデータ数で定義されていることは理論的矛盾である
1) 要因の影響を受ける前の測定値の平均
2) 要因Bの水準によらない要因Aの水準間の差は、要因Aの何か
3) 測定値に影響する原因の候補が2つの実験
4) 要因Aと要因Bの水準の組み合わせによって表現される区分
5) 一方の要因の水準の違いで他方の要因の水準間の平均が異なる効果
6) 要因A(3水準)と要因B(3水準)の2要因実験の母数の数はいくつあるか
10個($ ab+1)
放送授業
有意性検定の$ \alpha = 0.05には根拠がない
p値だけにたよって差の有無を判定することは誤り
差があるか否かという、実質科学的判定を、純粋に統計学の範囲内で済ませることはできない
差がある確率は、解釈可能だから、ドメイン知識を利用して確率を評価する
1) 計量データが従う分布
2) 計数データが従う分布
3) 数を数えるデータ
4) 量を測るデータ
5) $ n \times (n-1) \times \cdots \times 1は、$ nの何か
6) 結果が2値で、確率が一定である試行
7) ベルヌイ試行の成功確率
8) $ n回のベルヌイ試行の成功数$ xが従う分布
9) 賭けに勝った人の払い戻し倍率の逆数
10) 比率の差の別名
11) 比率の比の別名
12) 正反応は他方の反応の何倍生じやすいのかの比
放送授業
1変量の分布の特徴を要約する3番目の観点は歪度である 1) $ n回の試行の結果、$ k種類の値の観測数が従う分布
2) 変数Aのカテゴリが$ iで、かつ変数Bのカテゴリが$ jの観測度数
3) 変数Aのカテゴリを問わず、変数Bのカテゴリが$ jの観測度数
4) セル度数をデータ数で割った値
5) 変数Aのカテゴリが$ iで、かつ変数Bのカテゴリが$ jの母比率
6) クロス表で同時確率が周辺確率の積で表現されない状態
7) セルが独立な状態から解離している程度を表す指標
8) クロス表が連関している程度を表す指標
放送授業
標準偏差や相関係数や比率は、事前分布を一様分布とすると、標本統計値と伝統的な最尤推定値とMAP推定値の3つが一致する
post.sdは、MAPやMEDではなく、EAPの精度を示している
点として最頻値を計算するのは、初学者には難しい
EAPは初学者向きである。学習の進度に応じて好きな推定量を使用してよい
1) 一方の変数から他方の変数を予測・説明するための分析方法
2) 回帰分析における従属変数の別名は何か
3) 回帰分析における独立変数の別名は何か
4) 回帰分析における$ \hat y_iは基準変数の何か
5) 1次変換による予測式を何というか
6) 回帰直線$ \hat y = a + bxにおける母数$ aは何か
7) 回帰直線$ \hat y = a + bxにおける母数$ bは何か
8) 回帰分析における誤差変数の別名は何か
9) 基準変数の分散に占める、その予測値の分散の割合は何か
10) 回帰分析における独立変数と残差の散布図は何か
放送授業
データから計算した眼の前の95%信頼区間に母数が含まれる確率は95%ではない 95%の「95%信頼区間」が母数を含む
両側確信区間は、まれにMAP推定値を含まないこともある
1) 一つの観察対象から3回以上の測定を行ったデータ
2) 対称行列の形式で非対角要素を散布図に配したグラフ
3) 変数$ iと変数$ jの共分散を$ i行$ j列に並べた対称行列
4) 変数$ iと変数$ jの相関係数を$ i行$ j列に並べた対称行列
5) 複数の予測変数の重み付き和による基準変数の予測式
6) 重回帰式における予測変数にかかる係数
1) 複雑に込み入った現象を単純に理解することを目的に構成した概念
2) 構成概念を表現するための数理的表現
3) 因子によって多変量データの状態を説明するための潜在変数モデル
4) 構成概念に関する心理学的仮説がなくても分析が可能な因子分析
5) 心理学的な仮説を利用して行う因子分析
6) 因子から観測される変数に引かれた単方向の矢印に付された係数
7) 複数の回帰式を同時に推定する分析手法
8) パス図の中で単方向の矢印を1度も受け取っていない変数
9) パス図の中で単方向の矢印を受け取っている変数
10) 因子分析とパス解析を同時に行うことが可能な統合的な分析方法
11) 直交表を使い、予測変数を互いに無相関にした回帰分析
12) 予測変数の値を分岐させながら樹木を成長させる予測手法
13) 決定木における出発点のノード
14) 逆ロジット関数を利用し、2値の基準変数を予測する回帰分析
15) 人工知能の研究過程で発達した人工神経回路モデル
16) ニューラルネットワークの機械学習(母数推定法)の方法
17) 大規模試験を企画・作成・運用・評価するためのテスト理論
18) 複数の研究を統合し、確実性の高い結論を導く統計手法
19) メタ分析の結果を表示するための主要な統計グラフ
20) 回帰式の予測値をさまざまな確率分布に結びつけるための関数